profile<- fromJSON("/Users/micaelfilipe/Documents/elattes/json/unb.biologicas/profile.json")
#Análise das orientações
  # Tipos de orientação
profile %>% 
  sapply(function(x)
    names(x$orientacoes_academicas)) %>% 
  unlist() %>% unique()
## [1] "ORIENTACAO_CONCLUIDA_DOUTORADO"              
## [2] "ORIENTACAO_CONCLUIDA_MESTRADO"               
## [3] "ORIENTACAO_EM_ANDAMENTO_DOUTORADO"           
## [4] "OUTRAS_ORIENTACOES_CONCLUIDAS"               
## [5] "ORIENTACAO_EM_ANDAMENTO_INICIACAO_CIENTIFICA"
## [6] "ORIENTACAO_EM_ANDAMENTO_MESTRADO"            
## [7] "ORIENTACAO_CONCLUIDA_POS_DOUTORADO"          
## [8] "ORIENTACAO_EM_ANDAMENTO_GRADUACAO"
  # Media de orientação por pesquisador
  # Aqui é usado a media pois existem duplicações caso pesquisadores tenham orientado o mesmo trabalho
(profile %>% 
   sapply(function(x) 
     length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_DOUTORADO$natureza)) %>% 
   sum()) / length(profile)
## [1] 4.191176
(profile %>% 
    sapply(function(x) 
      length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_MESTRADO$natureza)) %>% 
    sum()) / length(profile)
## [1] 7.308824
# Número de pessoas por quantitativo de produções
profile %>% 
  sapply(function(x) 
    length(x$orientacoes_academicas$OUTRAS_ORIENTACOES_CONCLUIDAS$natureza)) %>% 
  unlist() %>% table()
## .
##  0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 22 23 24 25 26 
##  7  3  2  7  7  6  6  7 12  8  2  4  4  5  5  5  4  1  8  4  2  4  2  4  1  3 
## 27 29 31 34 36 37 38 42 43 76 
##  4  1  1  1  1  1  1  1  1  1
# Número de pessoas por tipo de orientação
profile %>% 
  sapply(function(x) 
    names(x$orientacoes_academicas)) %>% 
  unlist() %>% table()
## .
##               ORIENTACAO_CONCLUIDA_DOUTORADO 
##                                          107 
##                ORIENTACAO_CONCLUIDA_MESTRADO 
##                                          132 
##           ORIENTACAO_CONCLUIDA_POS_DOUTORADO 
##                                           59 
##            ORIENTACAO_EM_ANDAMENTO_DOUTORADO 
##                                          113 
##            ORIENTACAO_EM_ANDAMENTO_GRADUACAO 
##                                            4 
## ORIENTACAO_EM_ANDAMENTO_INICIACAO_CIENTIFICA 
##                                           77 
##             ORIENTACAO_EM_ANDAMENTO_MESTRADO 
##                                           93 
##                OUTRAS_ORIENTACOES_CONCLUIDAS 
##                                          129
# Número de produções em orientações por ano
profile %>% 
  sapply(function(x) 
    (x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_DOUTORADO$ano)) %>% 
  unlist() %>% table()
## .
## 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 
##   40   65   77   86   79   58   83   64   17    1

Dataframe

#extrai orientacoes 
perfil.df.orientacoes <- extrai.orientacoes(profile)
perfil.df.orientacoes %>% 
  filter(orientacao == "ORIENTACAO_CONCLUIDA_MESTRADO")%>% nrow()
## [1] 994
perfil.df.orientacoes %>% 
  filter(grepl("EM_ANDAMENTO", orientacao)) %>%
  group_by(natureza) %>% 
  summarize(n = n()) %>% 
  arrange(desc(n))
natureza n
Tese de doutorado 365
Dissertação de mestrado 218
Iniciação Científica 184
Trabalho de conclusão de curso de graduação 13
# Número de pessoas por tipo de orientação
table(unlist(sapply(profile, function(x) names(x$orientacoes_academicas))))
## 
##               ORIENTACAO_CONCLUIDA_DOUTORADO 
##                                          107 
##                ORIENTACAO_CONCLUIDA_MESTRADO 
##                                          132 
##           ORIENTACAO_CONCLUIDA_POS_DOUTORADO 
##                                           59 
##            ORIENTACAO_EM_ANDAMENTO_DOUTORADO 
##                                          113 
##            ORIENTACAO_EM_ANDAMENTO_GRADUACAO 
##                                            4 
## ORIENTACAO_EM_ANDAMENTO_INICIACAO_CIENTIFICA 
##                                           77 
##             ORIENTACAO_EM_ANDAMENTO_MESTRADO 
##                                           93 
##                OUTRAS_ORIENTACOES_CONCLUIDAS 
##                                          129
#Número de orientações concluidas
sum(sapply(profile, function(x) length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_MESTRADO$ano)))
## [1] 994
sum(sapply(profile, function(x) length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_DOUTORADO$ano)))
## [1] 570
sum(sapply(profile, function(x) length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_POS_DOUTORADO$ano)))
## [1] 266
# Número de pessoas por quantitativo de orientações por pessoa 0 = 1; 1 = 2...
table(unlist(sapply(profile, function(x) length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_MESTRADO$ano))))
## 
##  0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 20 29 48 
##  4  7  9 12  9 15 13 15  8  6  8 11  3  4  5  1  1  2  1  1  1
table(unlist(sapply(profile, function(x) length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_DOUTORADO$ano))))
## 
##  0  1  2  3  4  5  6  7  8  9 10 11 13 14 17 22 23 24 
## 29 13 18 14  8 10 12 10 10  3  1  1  1  2  1  1  1  1
table(unlist(sapply(profile, function(x) length(x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_POS_DOUTORADO$ano))))
## 
##  0  1  2  3  4  5  6  7  9 10 14 16 17 22 
## 77 12 16  4  7  5  3  4  2  1  2  1  1  1
# Número de orientações por ano
table(unlist(sapply(profile, function(x) (x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_MESTRADO$ano))))
## 
## 2010 2011 2012 2013 2014 2015 2016 2017 2018 
##   96  110  139  145  159  117  106   88   34
table(unlist(sapply(profile, function(x) (x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_DOUTORADO$ano))))
## 
## 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 
##   40   65   77   86   79   58   83   64   17    1
table(unlist(sapply(profile, function(x) (x$orientacoes_academicas$ORIENTACAO_CONCLUIDA_POS_DOUTORADO$ano))))
## 
## 2010 2011 2012 2013 2014 2015 2016 2017 2018 
##   31   22   31   41   53   28   34   21    5
perfil.df.orientacoes %>% 
      select(orientacao) %>% 
      group_by(orientacao) %>% 
      summarize(n=n()) 
orientacao n
ORIENTACAO_CONCLUIDA_DOUTORADO 570
ORIENTACAO_CONCLUIDA_MESTRADO 994
ORIENTACAO_CONCLUIDA_POS_DOUTORADO 266
ORIENTACAO_EM_ANDAMENTO_DOUTORADO 365
ORIENTACAO_EM_ANDAMENTO_GRADUACAO 13
ORIENTACAO_EM_ANDAMENTO_INICIACAO_CIENTIFICA 184
ORIENTACAO_EM_ANDAMENTO_MESTRADO 218
OUTRAS_ORIENTACOES_CONCLUIDAS 1809

Lista dos 10 mais por volume de Orientações concluídas de Mestrado

perfil.df.orientacoes %>% select(id_lattes_orientadores,orientacao) %>% group_by(id_lattes_orientadores) %>% filter(orientacao=="ORIENTACAO_CONCLUIDA_MESTRADO") %>% summarize(n=n())   %>% arrange(desc(n)) %>%  head(10)
id_lattes_orientadores n
8598274096498065 48
8539946335852637 29
3058512809761818 20
0029536556461484 17
9449484790926524 17
5804582372968711 16
8763062952090544 15
1415005734830737 14
2272000258230548 14
9065501029560884 14

                       

Lista dos 10 mais por volume de Orientações concluídas de Doutorado

 perfil.df.orientacoes %>% 
 select(id_lattes_orientadores,orientacao) %>%
 group_by(id_lattes_orientadores) %>% 
 filter(orientacao=="ORIENTACAO_CONCLUIDA_DOUTORADO") %>%
 summarize(n=n()) %>%
 arrange(desc(n))  %>%
 head(10)
id_lattes_orientadores n
8539946335852637 24
3058512809761818 22
8598274096498065 22
6121745125946782 16
7270239356755951 14
9065501029560884 14
9072332484355315 11
5505277659734432 10
9069808208981819 10
7339158885682632 9

Volume de Orientações Concluídas de Mestrado e Doutorado por Ano

   

orieconclusa <- perfil.df.orientacoes %>% filter(grepl("_CONCLUIDA_", orientacao)) %>% group_by(ano,orientacao) %>% summarize(n = n()) %>% mutate(orconcl = sub("ORIENTACAO_CONCLUIDA_","",orientacao)) %>% select(orconcl,ano,n) %>% spread(ano,n)

orieconclusa
orconcl 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
DOUTORADO 40 65 77 86 79 58 83 64 17 1
MESTRADO 96 110 139 145 159 117 106 88 34 NA
POS_DOUTORADO 31 22 31 41 53 28 34 21 5 NA

                     

oc_plot <- perfil.df.orientacoes %>% filter(grepl("_CONCLUIDA_", orientacao)) %>% filter(!grepl("POS_DOUTOR",orientacao)) %>% mutate(OC = sub("ORIENTACAO_CONCLUIDA_","",trimws(orientacao))) %>% select(ano,OC) %>% group_by(ano,OC) %>% summarize(n=n()) 

oc_plot %>% ggplot(aes(x=as.numeric(ano), y = n), color = OC) + geom_bar(stat="identity", aes(fill = OC ), position = "dodge") +
geom_smooth(aes(colour = OC),method = lm, formula = y ~ splines::bs(x, 3), se = FALSE) + xlab("Ano") + ylab("Qte") + ggtitle("Orientacoes Concluidas de Mestrado e Doutorado por Ano") 

Volume de Orientações por Natureza

   

cons529 <- perfil.df.orientacoes %>% mutate(natureza2 =if_else(trimws(natureza) == "Dissertação de mestrado", "DISS_MSTR",if_else(trimws(natureza)=="Iniciacao Cientifica" | trimws(natureza) == "INICIACAO_CIENTIFICA", "INIC_CIEN", if_else(trimws(natureza) == "MONOGRAFIA_DE_CONCLUSAO_DE_CURSO_APERFEICOAMENTO_E_ESPECIALIZACAO", "MONO_ESPC", if_else(trimws(natureza) == "Supervisao de pos-doutorado", "SUPV_DTRD",  if_else(trimws(natureza) == "Tese de doutorado",  "TESE_DTRD", if_else(trimws(natureza) == "Trabalho de conclusao de curso de graduacao" | trimws(natureza) == "TRABALHO_DE_CONCLUSAO_DE_CURSO_GRADUACAO",  "CONC_GRAD",  if_else(trimws(natureza) == "ORIENTACAO-DE-OUTRA-NATUREZA", "OUTR_ORIE", "NA"))))))))

cons530 <- cons529 %>% select(natureza2) %>% group_by(natureza2) %>% summarize(n=n()) %>% arrange(desc(n)) %>% mutate( perc = paste0(round(n/sum(n)*100,1)," %"))
cons530
natureza2 n perc
INIC_CIEN 1319 29.8 %
DISS_MSTR 1212 27.4 %
TESE_DTRD 935 21.2 %
NA 463 10.5 %
OUTR_ORIE 265 6 %
CONC_GRAD 200 4.5 %
MONO_ESPC 25 0.6 %
pie <- cons530 %>% filter(n>100) %>% ggplot(aes(x="", y=n, fill=natureza2)) +  geom_bar(stat="identity", width=1) + coord_polar("y", start=0) + geom_text(aes(label = perc), position = position_stack(vjust = 0.5), color="white") + labs(x = NULL, y = NULL, fill = NULL, title = "Volume de Orientações por Natureza") + theme_void() + theme(axis.line = element_blank(), axis.text = element_blank(), axis.ticks = element_blank(), plot.title = element_text(hjust = 0.5, color = "#666666"))
pie

Volume de Orientações por Ano e Natureza

   

natureza2 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
CONC_GRAD 43 30 33 21 12 24 17 19 1 NA
DISS_MSTR 96 110 141 145 159 128 174 184 75 NA
INIC_CIEN 151 205 175 206 177 170 158 75 2 NA
MONO_ESPC 5 2 6 2 2 2 5 1 NA NA
NA 32 27 41 41 58 41 79 131 13 NA
OUTR_ORIE 80 31 40 43 22 22 14 12 1 NA
TESE_DTRD 40 69 80 104 156 143 158 143 41 1
orientacoes <- extrai.orientacoes(profile) 
orientacoes <- orientacoes %>% select(titulo, ano, bolsa, agencia_financiadora, nome_orientadores, orientacao)

orientacoes <- orientacoes %>% mutate(ano = as.integer(ano), bolsa = as.factor(bolsa), 
    status = factor(if_else(grepl("CONCLUIDA", orientacao), "Concluído", "Em andamento"),
                       ordered = TRUE,  levels = c("Em andamento", "Concluído")),
    nivel = if_else(grepl("INICIACAO_CIENTIFICA", orientacao), "Iniciação científica",
            if_else(grepl("GRADUACAO", orientacao),            "Graduação",
            if_else(grepl("MESTRADO", orientacao),             "Mestrado",
            if_else(grepl("DOUTORADO", orientacao),            "Doutorado",
                                                               "Outro")))),
    bolsa = if_else(bolsa == "SIM", "Sim", "Não")
  ) %>%
  select(-orientacao) %>% filter(nivel %in% c("Mestrado", "Doutorado")) %>% 
  mutate(nivel = factor(nivel, ordered = TRUE, levels = c("Mestrado", "Doutorado")))

Docentes que Mais Orientaram

Em questão de números, o programa de pós-graduação possuiu, no intervalo observado, 1830 orientações concluídas.

Para que se pudesse observar quais são os docentes que mais tiveram impacto nesse número, foi construída a tabela abaixo.

orientacoes %>% filter(status == "Concluído") %>% group_by(nome_orientadores) %>% summarise(quantidade = n()) %>% arrange(desc(quantidade)) %>% `colnames<-`(c("Orientador", "Quantidade de Orientações Concluídas"))
Orientador Quantidade de Orientações Concluídas
Octavio Luiz Franco 86
Célia Maria de Almeida Soares 67
Maria Fatima Grossi de Sa 64
Ricardo Bentes de Azevedo 34
Jonny Everson Scherwinski Pereira 32
Rinaldo Wellerson Pereira 32
Francisco José Lima Aragão 30
Guarino Rinaldi Colli 29
Mercedes Maria da Cunha Bustamante 28
Maria Sueli Soares Felipe 27
Jader Soares Marinho Filho 25
Bergmann Morais Ribeiro 24
Sônia Nair Báo 24
Elisabeth Nogueira Ferroni Schwartz 23
José Roberto Rodrigues Pinto 23
Marta Cristina Corsi de Filippi 23
José Francisco Gonçalves Júnior 22
Marcos José da Silva 22
Emerson Monteiro Vieira 21
Fernando Araripe Gonçalves Torres 21
Miguel Ângelo Marini 21
Renato de Oliveira Resende 21
Zulmira Guerrero Marques Lacava 21
Cesar Koppe Grisolia 20
Mariana de Souza Castro 20
Reuber Albuquerque Brandao 20
Rodrigo Gurgel Goncalves 20
Jose Roberto Pujol Luz 19
Ricardo Bomfim Machado 19
Tatsuya Nagata 19
Carolina Madeira Lucci 18
Ivone Rezende Diniz 18
Marcelo de Macedo Brigido 18
Edivaldo Ximenes Ferreira Filho 17
Carolyn Elinore Barnes Proenca 16
Dalva Graciano Ribeiro 16
Anamélia Lorenzetti Bocca 15
Augusto Cesar Franco 15
Ludmilla Moura de Souza Aguiar 15
Márcia Renata Mortari 15
Maria Imaculada Muniz Barboza Junqueira 15
Silviene Fabiana de Oliveira 15
Regina Helena Ferraz Macedo 14
Wagner Fontes 14
Carlos Andre Ornelas Ricart 13
Dario Grattapaglia 13
Edison Ryoiti Sujii 13
Eliane Ferreira Noronha 13
Ildinete Silva Pereira 13
José Carmine Dianese 13
José Raimundo Corrêa 13
Nádia Skorupa Parachin 13
Ricardo Henrique Kruger 13
Rosana Tidon 13
Sonia Maria de Freitas 13
Aldicir Osni Scariot 12
Andrea Queiroz Maranhao ; Marcelo de Macedo Brigido 12
Betania Ferraz Quirino 12
Jaime Martins de Santana 12
Kelly Grace Magalhães 12
Marcio José Poças Fonseca 12
Paulo Eduardo Aguiar Saraiva Camara 12
Cássia Beatriz Rodrigues Munhoz 11
Daniel Luis Mascia Vieira 11
Denise Navia Magalhães Ferreira 11
Marcelo Valle de Sousa 11
Robert Neil Gerard Miller 11
Carlos Alberto Bezerra Tomaz 10
Carlos Bloch Junior 10
Christopher William Fagg 10
Maria Clotilde Henriques Tavares 10
Mariana Machado Hecht 10
Osmindo Rodrigues Pires Júnior 10
Regina Célia de Oliveira 10
Renato Caparroz 10
Sébastien Olivier Charneau 10
Andrea Queiroz Maranhao 9
Beatriz Dolabela de Lima 9
Fabian Borghetti 9
Gabriela Bielefeld Nardoto 9
Izabela Marques Dourado Bastos Charneau 9
Marcelo Hermes Lima 9
Mercedes Maria da Cunha Bustamante ; Mercedes Maria da Cunha Bustamante ; Mercedes Maria da Cunha Bustamante 9
Taciana Barbosa Cavalcanti 9
Guilherme Martins Santos 8
Helson Mario Martins do Vale 8
Ludgero Cardoso Galli Vieira 8
Paulo César Motta 8
Raúl Alberto Laumann 8
Rita de Cássia Pereira Carvalho 8
Aline Pic 7
Heloisa Sinatora Miranda 7
João Alexandre Ribeiro Gonçalves Barbosa 7
Luiz Alfredo Rodrigues Pereira 7
Marcelo Fragomeni Simon 7
Reginaldo Constantino 7
Thomas Christopher Rhys Williams 7
Werner Treptow 7
Carlos Andre Ornelas Ricart ; Edivaldo Ximenes Ferreira Filho 6
Cynthia Maria Kyaw 6
Hélder Nagai Consolaro 6
João Paulo Figueiró Longo 6
Lucia Helena Soares e Silva 6
Maria de Fátima M Almeida Santos 6
Maria Sueli Soares Felipe ; Larissa Fernandes Matos 6
Antonio Sebben 5
Cecilia Beatriz Fiuza Favali 5
João Ricardo Moreira de Almeida 5
Lilian Gimenes Giugliano 5
Lúcio Flávio de Alencar Figueiredo 5
Miguel Borges 5
Monica Pereira Garcia 5
Patrícia Albuquerque de Andrade Nicola 5
Carlos Andre Ornelas Ricart ; Beatriz Dolabela de Lima 4
Carlos Andre Ornelas Ricart ; Sébastien Olivier Charneau 4
Felipe Saldanha de Araujo 4
Monica Pereira Garcia ; Ricardo Bentes de Azevedo 4
Regina Helena Ferraz Macedo ; Regina Helena Ferraz Macedo 4
Renato Caparroz ; Renato Caparroz 4
Sueli Maria Gomes 4
Vicente de Paulo Martins 4
Aldo Henrique Fonseca Pacheco Tavares 3
Alex Leite Pereira 3
Ana Claudia Guerra de Araujo 3
Conceição Eneida dos Santos Silveira 3
Cristiane da Silva Ferreira 3
Daniela Mara de Oliveira 3
Elibio Leopoldo Rech Filho 3
Georgios Joannis Pappas Júnior 3
Larissa Fernandes Matos 3
Maria Julia Martins Silva 3
Marina Regina Frizzas 3
Micheline Carvalho Silva 3
Rafael Plakoudi Souto Maior 3
Anamélia Lorenzetti Bocca ; Aldo Henrique Fonseca Pacheco Tavares 2
Carlos Andre Ornelas Ricart ; Marcelo Valle de Sousa 2
Carlos Eduardo Guimarães Pinheiro 2
Christopher William Fagg ; Aldicir Osni Scariot 2
Edison Ryoiti Sujii ; Regina Helena Ferraz Macedo 2
Guarino Rinaldi Colli ; Ricardo Bomfim Machado 2
Kelly Grace Magalhães ; José Raimundo Corrêa 2
Márcia Renata Mortari ; Elisabeth Nogueira Ferroni Schwartz 2
Marcio José Poças Fonseca ; Ildinete Silva Pereira 2
Marcio José Poças Fonseca ; Ricardo Bentes de Azevedo 2
Maria de Fátima M Almeida Santos ; Ricardo Bentes de Azevedo 2
Maria Fatima Grossi de Sa ; Anamélia Lorenzetti Bocca 2
Maria João Feio 2
Maria Sueli Soares Felipe ; Fernando Araripe Gonçalves Torres 2
Marlene Teixeira De-Souza 2
Marlene Teixeira De-Souza ; Sonia Maria de Freitas 2
Nádia Skorupa Parachin ; João Alexandre Ribeiro Gonçalves Barbosa 2
Reginaldo Constantino ; Jose Roberto Pujol Luz 2
Renato de Oliveira Resende ; Bergmann Morais Ribeiro 2
Silviene Fabiana de Oliveira ; Aline Pic 2
Tatiana Amabile de Campos 2
Tatsuya Nagata ; Francisco José Lima Aragão 2
Vicente de Paulo Martins ; Beatriz Dolabela de Lima 2
Zulmira Guerrero Marques Lacava ; Sônia Nair Báo 2
Antonio Jose Camillo de Aguiar 1
Janice Lisboa De Marco 1
Julia Klaczko 1
orientacoes  %>% group_by(nome_orientadores, status) %>% summarise(quantidade = n()) %>%
  ggplot(aes(reorder(nome_orientadores, quantidade), quantidade, fill = status)) + geom_bar(stat = "identity") +
  facet_grid(.~status) + coord_flip() +
  scale_y_discrete(labels = function(x) str_wrap(x, width = 10)) + geom_text(aes(label = quantidade), hjust = -0.1, size = 3) + theme_minimal() + ylim(0, 25) +
  labs(title = "Distribuição das orientações por status", x = "Docente", y = "Status", fill = "") +
  scale_x_discrete(labels = function(x) str_wrap(x, width = 20))
## Warning: Removed 11 rows containing missing values (position_stack).
## Warning: Removed 11 rows containing missing values (geom_text).

Distribuição de Bolsas de Orientação

Um aspecto que pode ser de interesse comum entre as várias partes interessadas, é sobre quais são os orientadores que mais captam bolsas para seus projetos de orientação. Para auxiliar na resposta, a tabela abaixo coloca cada docente ao lado da quantidade de projetos com financiamento que o docente realizou.

orientacoes %>% filter(bolsa == "Sim") %>% group_by(nome_orientadores) %>% summarise(quantidade = n()) %>% arrange(desc(quantidade)) %>% `colnames<-`(c("Orientador", "Quantidade de Orientações com Bolsa"))
Orientador Quantidade de Orientações com Bolsa
Octavio Luiz Franco 95
Célia Maria de Almeida Soares 64
Maria Fatima Grossi de Sa 63
Jonny Everson Scherwinski Pereira 38
Guarino Rinaldi Colli 36
Francisco José Lima Aragão 30
Marcos José da Silva 29
Maria Sueli Soares Felipe 29
Emerson Monteiro Vieira 28
Marta Cristina Corsi de Filippi 28
Mercedes Maria da Cunha Bustamante 28
Renato de Oliveira Resende 26
Sônia Nair Báo 26
Ricardo Bentes de Azevedo 25
Rinaldo Wellerson Pereira 25
Elisabeth Nogueira Ferroni Schwartz 24
Jader Soares Marinho Filho 24
José Francisco Gonçalves Júnior 24
Fernando Araripe Gonçalves Torres 23
José Roberto Rodrigues Pinto 22
Marcelo de Macedo Brigido 22
Tatsuya Nagata 22
Bergmann Morais Ribeiro 21
Reuber Albuquerque Brandao 21
Cesar Koppe Grisolia 20
Márcia Renata Mortari 20
Mariana de Souza Castro 20
Miguel Ângelo Marini 20
Kelly Grace Magalhães 19
Ludmilla Moura de Souza Aguiar 19
Regina Helena Ferraz Macedo 18
Anamélia Lorenzetti Bocca 17
Edivaldo Ximenes Ferreira Filho 17
Eliane Ferreira Noronha 17
Nádia Skorupa Parachin 17
Carolyn Elinore Barnes Proenca 16
Ildinete Silva Pereira 16
José Raimundo Corrêa 16
Robert Neil Gerard Miller 16
Rodrigo Gurgel Goncalves 16
Aldicir Osni Scariot 15
Carolina Madeira Lucci 15
Jose Roberto Pujol Luz 15
Andrea Queiroz Maranhao ; Marcelo de Macedo Brigido 14
Dalva Graciano Ribeiro 14
Dario Grattapaglia 14
Gabriela Bielefeld Nardoto 14
Ivone Rezende Diniz 14
Izabela Marques Dourado Bastos Charneau 14
José Carmine Dianese 14
Ricardo Bomfim Machado 14
Ricardo Henrique Kruger 14
Rosana Tidon 14
Augusto Cesar Franco 13
Daniel Luis Mascia Vieira 13
Marcelo Valle de Sousa 13
Osmindo Rodrigues Pires Júnior 13
Paulo Eduardo Aguiar Saraiva Camara 13
Sébastien Olivier Charneau 13
Taciana Barbosa Cavalcanti 13
Carlos Andre Ornelas Ricart 12
Cássia Beatriz Rodrigues Munhoz 12
Denise Navia Magalhães Ferreira 12
João Alexandre Ribeiro Gonçalves Barbosa 12
Marcio José Poças Fonseca 12
Renato Caparroz 12
Zulmira Guerrero Marques Lacava 12
Carlos Bloch Junior 11
Edison Ryoiti Sujii 11
Fabian Borghetti 11
Jaime Martins de Santana 11
Silviene Fabiana de Oliveira 11
Sonia Maria de Freitas 11
Werner Treptow 11
Mariana Machado Hecht 10
Rita de Cássia Pereira Carvalho 10
Thomas Christopher Rhys Williams 10
Beatriz Dolabela de Lima 9
Betania Ferraz Quirino 9
Hélder Nagai Consolaro 9
Marcelo Fragomeni Simon 9
Maria de Fátima M Almeida Santos 9
Mercedes Maria da Cunha Bustamante ; Mercedes Maria da Cunha Bustamante ; Mercedes Maria da Cunha Bustamante 9
Regina Célia de Oliveira 9
Christopher William Fagg 8
Ludgero Cardoso Galli Vieira 8
Luiz Alfredo Rodrigues Pereira 8
Andrea Queiroz Maranhao 7
Cynthia Maria Kyaw 7
Guilherme Martins Santos 7
Helson Mario Martins do Vale 7
Maria Clotilde Henriques Tavares 7
Maria Imaculada Muniz Barboza Junqueira 7
Carlos Alberto Bezerra Tomaz 6
Carlos Andre Ornelas Ricart ; Edivaldo Ximenes Ferreira Filho 6
Elibio Leopoldo Rech Filho 6
Heloisa Sinatora Miranda 6
João Paulo Figueiró Longo 6
Lúcio Flávio de Alencar Figueiredo 6
Maria Sueli Soares Felipe ; Larissa Fernandes Matos 6
Patrícia Albuquerque de Andrade Nicola 6
Paulo César Motta 6
Wagner Fontes 6
Aline Pic 5
Antonio Jose Camillo de Aguiar 5
Antonio Sebben 5
João Ricardo Moreira de Almeida 5
Marcelo Hermes Lima 5
Marlene Teixeira De-Souza 5
Micheline Carvalho Silva 5
Monica Pereira Garcia 5
Reginaldo Constantino 5
Vicente de Paulo Martins 5
Aldo Henrique Fonseca Pacheco Tavares 4
Ana Claudia Guerra de Araujo 4
Carlos Andre Ornelas Ricart ; Beatriz Dolabela de Lima 4
Carlos Andre Ornelas Ricart ; Sébastien Olivier Charneau 4
Georgios Joannis Pappas Júnior 4
Larissa Fernandes Matos 4
Marina Regina Frizzas 4
Miguel Borges 4
Monica Pereira Garcia ; Ricardo Bentes de Azevedo 4
Regina Helena Ferraz Macedo ; Regina Helena Ferraz Macedo 4
Renato Caparroz ; Renato Caparroz 4
Sueli Maria Gomes 4
Tatiana Amabile de Campos 4
Cecilia Beatriz Fiuza Favali 3
Conceição Eneida dos Santos Silveira 3
Cristiane da Silva Ferreira 3
Daniela Mara de Oliveira 3
Lilian Gimenes Giugliano 3
Rafael Plakoudi Souto Maior 3
Raúl Alberto Laumann 3
Carlos Andre Ornelas Ricart ; Marcelo Valle de Sousa 2
Christopher William Fagg ; Aldicir Osni Scariot 2
Edison Ryoiti Sujii ; Regina Helena Ferraz Macedo 2
Felipe Saldanha de Araujo 2
Ildinete Silva Pereira ; Patrícia Albuquerque de Andrade Nicola 2
Janice Lisboa De Marco 2
João Alexandre Ribeiro Gonçalves Barbosa ; Sonia Maria de Freitas 2
João Ricardo Moreira de Almeida ; Janice Lisboa De Marco 2
Kelly Grace Magalhães ; José Raimundo Corrêa 2
Lucia Helena Soares e Silva 2
Marcelo de Macedo Brigido ; Marlene Teixeira De-Souza 2
Marcio José Poças Fonseca ; Ildinete Silva Pereira 2
Marcio José Poças Fonseca ; Ricardo Bentes de Azevedo 2
Maria de Fátima M Almeida Santos ; Ricardo Bentes de Azevedo 2
Maria Fatima Grossi de Sa ; Anamélia Lorenzetti Bocca 2
Maria João Feio 2
Maria Sueli Soares Felipe ; Fernando Araripe Gonçalves Torres 2
Marlene Teixeira De-Souza ; Sonia Maria de Freitas 2
Nádia Skorupa Parachin ; João Ricardo Moreira de Almeida 2
Osmindo Rodrigues Pires Júnior ; Mariana de Souza Castro 2
Renato de Oliveira Resende ; Bergmann Morais Ribeiro 2
Silviene Fabiana de Oliveira ; Aline Pic 2
Tatsuya Nagata ; Francisco José Lima Aragão 2
Vicente de Paulo Martins ; Beatriz Dolabela de Lima 2
Zulmira Guerrero Marques Lacava ; Sônia Nair Báo 2
Julia Klaczko 1
Maria Julia Martins Silva 1
orientacoes  %>% group_by(nome_orientadores, bolsa) %>% summarise(quantidade = n()) %>%
  ggplot(aes(reorder(nome_orientadores, quantidade), quantidade, fill = bolsa)) + geom_bar(stat = "identity") +
  facet_grid(.~bolsa) + coord_flip() +
  scale_y_discrete(labels = function(x) str_wrap(x, width = 10)) + geom_text(aes(label = quantidade), hjust = -0.1, size = 3) + theme_minimal() + ylim(0, 25) +
  labs(title = "Distribuição das Orientações por Bolsa", x = "Docente", y = "Bolsa", fill = "Bolsa") +
  scale_x_discrete(labels = function(x) str_wrap(x, width = 20))
## Warning: Removed 13 rows containing missing values (position_stack).
## Warning: Removed 13 rows containing missing values (geom_text).

Como pode ser observado pelo gráfico acima, Flávia Millena Biroli Tokarski é a docente que mais conseguiu bolsas para os projetos em que orientou.

Quem financia?

orientacoes %>% filter(agencia_financiadora != "") %>% group_by(agencia_financiadora) %>% summarise(quantidade = n()) %>%
  arrange(desc(quantidade)) %>% `colnames<-`(c("Agência Financiadora", "Orientações Financiadas"))
Agência Financiadora Orientações Financiadas
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior 1003
Conselho Nacional de Desenvolvimento Científico e Tecnológico 738
Fundação de Apoio à Pesquisa do Distrito Federal 30
Fundação de Amparo a Pesquisa do Estado de Goiás 7
Fundação de Amparo à Pesquisa do Estado de São Paulo 7
Fundação de Amparo à Pesquisa do Estado de Minas Gerais 5
cnpq 3
EMBRAPA 3
Centro de Desenvolvimento Tecnológico - FUB 2
Empresa Brasileira de Pesquisa Agropecuária 2
Financiadora de Estudos e Projetos 2
Fundação Artur Bernardes 2
Fundação de Amparo à Pesquisa do Estado da Bahia 2
Fundação de Apoio à Peaquisa do Estado de Goiás 2
Fundação de Apoio à Pesquisa 2
Fundação para a Ciência e Tecnologia 2
REUNI 2
UnB 2
Banco Nacional do Desenvolvimento 1
Centro Nacional de Recursos Genéticos e Biotecnológicos 1
Cnpq 1
Embrapa 1
EMBRAPA Cerrados 1
Embrapa Recursos Genéticos e Biotecnologia 1
Empresa Brasileira de Pesquisa Agropecuaria 1
Empresa privada 1
Fundação 1
Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco 1
Fundação de Amparo a Pesquisa do Estado do Amazonas 1
Fundação de Amparo à Pesquisa do Estado do Amazonas 1
Fundação de Amparo à Pesquisa do Estado do Piauí 1
Fundação de Apoio à Pesquisa do Estado de Rondônia 1
Fundação de Apoio e Desenvolvimento do Ensino, Ciência e Tecnologia do MS 1
GOVERNO DO EQUADOR 1
MEC/CAPES e MCT/CNPq/FINEP 1
Ministério da Educação e Cultura - Bolsa Reuni de Assistência ao Ensino 1
National Academy of Sciences 1
PETROBRAS 1
Secretaria Nacional de Estudios Superiores Ciencias y Tecnologia 1
Swiss National Science Foundation 1
Universidade Catolica de Brsília 1
Universidade de Brasiia 1
Universidade de Brasília - Reuni 1
Universidade de Brasília/Reuni 1
#Número de orientações por ano
perfil.df.orientacoes%>%
  group_by(ano)%>%
  ggplot(aes(x = ano))+
  geom_bar(fill = "blue")+
  theme_minimal()+
  ggtitle("Número de orientações")

Contagem de orientações por tipo de orientação

  ### analise das orientacoes
  orientacao_extracted <- extrai.orientacoes(profile)
  orientacao_df <- tibble(orientacao_extracted)
  orientacao_df$natureza <- iconv(tolower(orientacao_df$natureza), from = 'UTF-8', to = 'ASCII//TRANSLIT')
  orientacao_df$natureza <- gsub("[[:punct:]]", " ", orientacao_df$natureza)
  orientacao_df$natureza <- gsub("monografia de conclusao de curso", "monografia de conclusao de curso\n",orientacao_df$natureza)
  orientacao_df$natureza <- factor(orientacao_df$natureza)
  
  # Grafico tipos orientacoes
  orientacao_df %>%
  ggplot(aes(x=fct_infreq(natureza), fill=factor(natureza))) +
  geom_bar(position="dodge") +
  theme(legend.position="bottom", panel.grid.major.y = element_blank()) +
  coord_flip()

Contagem de orientações por ano por tipo de orientação

  # Grafico tipos orientacoes por ano
  orientacao_df %>%
  ggplot(aes(x=fct_infreq(natureza), fill=factor(natureza))) +
  geom_bar(position="dodge") +
  facet_wrap(~ factor(ano), ncol=2) +
  theme(legend.position="bottom", panel.grid.major.y = element_blank(), text=element_text(size=12)) +
  coord_flip()

# Grafico bolsista por tipo orientacao
orientacao_df %>%
  ggplot(aes(x=fct_infreq(natureza), fill=factor(bolsa))) +
  geom_bar(position="dodge") +
  theme(axis.text.x = element_text(angle = 60, size=7, hjust = 1), panel.grid.major.x = element_blank())  

orientacao_df %>%
  ggplot(aes(x=fct_infreq(natureza), fill=factor(bolsa))) +
  geom_bar(position="fill") +
  theme(axis.text.x = element_text(angle = 60, size=7, hjust = 1), panel.grid.major.x = element_blank())  

# Grafico bolsistas por ano
orientacao_df %>%
  ggplot(aes(x=factor(ano), fill=factor(bolsa))) +
  geom_bar(position="dodge") +
  theme(panel.grid.major.x = element_blank())

# Grafico bolsistas por ano
orientacao_df %>%
  ggplot(aes(x=factor(ano), fill=factor(bolsa))) +
  geom_bar(position="fill") +
  theme(panel.grid.major.x = element_blank())

Nuvem de palavras baseadas nos títulos das orientações de mestrado:

library(tm)
## Loading required package: NLP
## 
## Attaching package: 'NLP'
## The following object is masked from 'package:ggplot2':
## 
##     annotate
library(wordcloud)
## Loading required package: RColorBrewer
library(tidyverse)

text_orientacoes<- data.frame(doc_id=perfil.df.orientacoes$natureza, text = perfil.df.orientacoes$titulo, stringsAsFactors = default.stringsAsFactors())

text_mestrado <- text_orientacoes%>%filter(doc_id=="Dissertação de mestrado")

texto_mestrado <- Corpus(DataframeSource(text_mestrado))
texto_mestrado <- tm_map(texto_mestrado, content_transformer(tolower))
texto_mestrado<- tm_map(texto_mestrado, removeNumbers)
texto_mestrado<-tm_map(texto_mestrado, removePunctuation)
texto_mestrado<-tm_map(texto_mestrado, removeWords, stopwords("pt"))
texto_mestrado <- tm_map(texto_mestrado, removeWords, c("universidade", "federal","enfermagem","pósgraduação","enfermeira", "enfermeiro","saude","brasília","faculdade","pesquisa","departamento","programa","unb","saúde", "escola","possui","mestrado","paulo","doutorado","grupo","professora","área","ciências","coordenadora","membro", "desde", "atualmente","graduação"))
texto_mestrado <- tm_map(texto_mestrado, stripWhitespace)

dtm_mestrado<-TermDocumentMatrix(texto_mestrado)
m_mestrado<-as.matrix(dtm_mestrado)
v_mestrado<-sort(rowSums(m_mestrado),decreasing = TRUE)
d_mestrado<- data.frame(word=names(v_mestrado),freq=v_mestrado)
set.seed(1234)
wordcloud(words =(d_mestrado$word), freq = d_mestrado$freq, min.freq = 3, max.words=30,scale = c(4, 0.2), random.order=FALSE, rot.per=0.35, colors=brewer.pal(8, "Dark2"))

Nuvem de palavras baseadas nos títulos das orientações de doutorado:

library(tm)
library(wordcloud)
library(tidyverse)

text_doutorado<-text_orientacoes%>%filter(doc_id=="Tese de doutorado")

texto_doutorado <- Corpus(DataframeSource(text_doutorado))
texto_doutorado <- tm_map(texto_doutorado, content_transformer(tolower))
texto_doutorado<- tm_map(texto_doutorado, removeNumbers)
texto_doutorado<-tm_map(texto_doutorado, removePunctuation)
texto_doutorado<-tm_map(texto_doutorado, removeWords, stopwords("pt"))
texto_doutorado <- tm_map(texto_doutorado, removeWords, c("universidade", "federal","enfermagem","pósgraduação","enfermeira", "enfermeiro","saude","brasília","faculdade","pesquisa","departamento","programa","unb","saúde", "escola","possui","mestrado","paulo","doutorado","grupo","professora","área","ciências","coordenadora","membro", "desde", "atualmente","graduação"))
texto_doutorado <- tm_map(texto_doutorado, stripWhitespace)

dtm_doutorado<-TermDocumentMatrix(texto_doutorado)
m_doutorado<-as.matrix(dtm_doutorado)
v_doutorado<-sort(rowSums(m_doutorado),decreasing = TRUE)
d_doutorado<- data.frame(word=names(v_doutorado),freq=v_doutorado)
set.seed(1234)
wordcloud(words =(d_doutorado$word), freq = d_doutorado$freq, min.freq = 3, max.words=30,scale = c(4, 0.2), random.order=FALSE, rot.per=0.35, colors=brewer.pal(8, "Dark2"))

graf4<- orientacao_df %>% 
  filter(ano != "") %>%
  select(natureza, ano) %>%
  group_by(natureza, ano) %>% 
  summarize(n = n()) 

ggplot(graf4, aes(x = ano, y = n, color = natureza)) +
  geom_jitter()

Orientandos por docente:

#o.o
o.o<-unlist(sapply(profile, function(x) sapply(x$orientacoes_academicas, function(y) y$nome_orientadores)))
o.o<-as.data.frame(o.o)
top<-as.data.frame(sort(table(o.o),decreasing = TRUE))
ggplot(top,aes(x=o.o,y=Freq))+geom_bar(stat='identity',aes(fill=Freq)) +
  coord_flip()